خوشه بندی داده های بیماری قلبی با نرم افزار وکا we
عنوان پروژه: خوشه بندی داده های بیماری قلبی با نرم افزار وکا weka
نرم افزار مورد استفاده:weka وکا
فرمت: .arff
لافاصله فایلهای خوشه بندی داده های بیماری قلبی با نرم افزار وکا weka برای شما ایمیل خواهد شد.
دسته: پروژه برنامه نویسی آماده, فروشگاه مهندسی کامپیوتر برچسب: weka, خوشه بندی داده با وکا weka, خوشه بندی داده های بیماری قلبی, وکا Item sold: 1
وشه بندی داده های بیماری قلبی با نرم افزار وکا weka
دیتاست شامل ویژگیهایی از جمله، عددی و نوعی است و از نوع دستهبندی محسوب میشود. تعداد نمونههای موجود 303 نمونه است که شامل 75 ویژگی است که missing value نیز دارد. این دیتاست در سال 1988 جمعآوری شده است. شکل زیر اطلاعات کلی ذکر شده را نمایش میدهد
خوشه بندی داده های بیماری قلبی با نرم افزار وکا weka
طبق مقالات ارائه شده در بحث کلاسبندی که از این دیتاست استفاده کردهاند، فقط از 14 ویژگی مهمتر از 75 ویژگی موجود استفاده کردهاند. ما نیز از همین 14 ویژگی بهره بردهایم
14 ویژگی مورد نظر شامل موارد زیر است:
شماره ویژگی نام ویژگی نوع ویژگی توضیحات
1 age سن سن فرد
2 sex جنسیت جنسیت فرد شامل زن و مرد به صورت عددی باینری
3 cp نوع درد سینه 4 نوع از دردهای سینه مثل، درد معمولی، بی علامت، آتی پیک، غیر آنژینی
4 trestbps فشارخون بر حسب میلیمتر جیوه
5 chol میزان کلسترول میزان کلسترول بر حسب میلیگرم در یکدهم لیتر
6 fbs قند خون به صورت صفر و یک به شرط کوچکتر یا بزرگتر از 120 میلیگرم در یکدهم لیتر
7 restecg نوار قلب شامل سه نوع نوار قلب معمولی، غیرعادی، مخاطره در بطن چپ
8 thalach حداکثر ضربان قلب بیشترین ضربان قلب ثبت شده به صورت عددی
9 exang آنژین صدری ناشی از ورزش به صورت عددی باینری در صورت داشتن یا نداشتن ویژگی ذکر شده
10 oldpeak تنزل نقاط S, T حاصل از نوار قلب به صورت عددی و تنزل نقاط ST را نشان میدهد
11 slope شیب نقاط S, T حاصل از نوار قلب نوع شیب به صورت، شیب صعودی، نزولی و ثابت
12 ca تعداد عروق متورم یک متغیر عددی
13 thal نوع تالاسمی شامل سه نوع، معمولی، نقص ثابت و نقض برگشتپذیر
14 class نوع بیماری قلبی شامل عددهای 0 تا 4 که عدد صفر نشان دهنده نداشتن مشکل قلبی و 1 تا 4 مربوط به انواع دیگر مشکلات قلبی
نمودار زیر، مربوط به نقاط ST ذکر شده از نوار قلب است.
خوشه بندی داده های بیماری قلبی با نرم افزار وکا weka
در این پروژه 5 روش دستهبندی متفاوت را انتخاب کردهایم. هر کدام دارای ویژگیها و معایب خاص خود هستند که باعث میشود برای هر مسئله، بر حسب نیاز، یک روش دستهبندی خاص را استفاده کنیم. همانگونه که ملاحظه شد روش شبکه عصبی یا همان پرسپترون چندلایه بهترین دقت را داشت هر چند این روش از لحاظ زمان یادگیری بیشترین زمان را لازم داشت. این در حالی است که سایر روشها بسیار سریعتر انجام میشوند.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
شماره آزمایش نام روش دستهبندی دقت دستهبندی (درصد) زمان آموزش (ثانیه)
1 درخت تصمیم 52 0.04
2 بیز ساده 55 0
3 پرسپترون چندلایه 60 0.43
4 ماشین بردار پشتیبان 57.75 0.03
5 نزدیکترین همسایگی 57.42 0
نمودار میلهای زیر، دقت روشهای مورد استفاده را در یک قاب نشان میدهد. مشخص است که روش پرسپترون دقت بالاتری دارد و درخت تصمیم پایین ترین دقت. از طرف بیز ساده با سادگی موجود، دقت مناسبی نسبت به سایر روشهایی مثل SVM و KNN دارد.
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com